Čekatelé na nové grafiky Nvidia GeForce generace Ampere už to mají tady. První model, GeForce RTX 3080 se začal prodávat včera od 15:00. Recenze custom karet vyšly ve stejném čase, ale už o den předtím vyšly v předstihu testy provedení Founders Edition, což je verze karty prodávaná přímo Nvidií a také ta, jejíž fotky jste viděli všude během odhalení a následujících článcích.
Už jsme se věnovali odhalení a tomu, co kartách tehdy říkala sám šéf Nvidie Jen-Hsun Huang a poté ve dvou částech architekturou (podrobný článek a část informací předtím v menším). Teď se tedy podíváme na to, jaký herní výkon předvádí GeForce RTX 3080 v těchto prvních recenzích.
GeForce RTX 3080: jak dobře dopadl výkon?
Pro rychlou rekapitulaci: GeForce RTX 3080 obsahuje čip GA102 ořezaný na 8704 shaderů (vysoké číslo je kvůli změně architektury zdvojnásobující počet FP32 jednotek na jeden blok SM proti Turingu). GPU běží na 1440 MHz v základu, takt boostu je uváděn 1710 MHz. Karta má 10 GB paměti GDDR6X (jde o zcela novou technologii od Micronu, na které Nvidia spolupracovala), ta má takt 19,0 GHz a spolu se 320bitovou sběrnicí propustnost 760 GB/s.
Poněkud horší je TDP, 320 W, což se na kartách ostatních výrobců bude obyčejně napájet dvěma osmipiny (někdy třemi). Ale karta Founders Edition od Nvidie má místo toho speciální 12pinový konektor, jenž ovšem dnes vyžaduje adaptér (je v ceně). Nvidia ho nabídne ke standardizaci, zatím je z pohledu standardu zdrojů proprietární. Cena karty je oficiálně 699 $/699 € au nás 18 999 Kč. Oficiální částka je tedy stejná jako u modelu RTX 2080/RTX 2080 Super, Ampere na rozdíl od Turingu v roce 2018 nezdražil.
Z webů, které tradičně odkazujeme a „používáme“ má recenzi karet Founders Edition vydanou techPowerUp, PC Perspective (test na Ryzenu 9 3900X), Tom's Hardware a německý ComputerBase. AnandTech bude mít zpoždění, částečně i kvůli ničivým požárům v Kalifornii.
Výkon: nejlepší v 4K, přínosy v 1080p limituje procesor
A teď už k výkonu. Jak už bylo od začátku jasné, Ampere bude výrazně větší mezigenerační nárůst výkonu než Turing, ale otázka bylo, kolik procent to přesně znamená. RTX 3080 je možné zhodnotit tak, že jde teď o skvělou grafiku pro rozlišení 4K (ovšem pamatujte, že je to zatím jediný model nové generace, takže výhodnost a „ideálnost“ by se měla hodnotit až když se aktualizuje celý kádr). Na nižších rozlišeních je totiž GPU typicky limitováno výkonem procesoru a možná by se také mohlo ukazovat to, že velké množství FP32 jednotek se na nižších rozlišeních s vyšší důležitostí geometrického výkonu méně uplatní (to je ale jenom hypotéza).
3840 × 2160
Ve 4K má ale každopádně karta nejlepší výsledky a zároveň docela slušné hratelné FPS (60+), takže označení za 4K grafiku není žádné přehánění. Podle ComputerBase, techPowerUpu a Tom's Hardware – uvádíme hodnoty pro všechny v tomto pořadí – vychází GeForce RTX 3080 o 60 %/56 %/58,8 % rychlejší než GeForce RTX 2080 Super a o 31%/32%/32,7 % rychlejší než GeForce RTX 2080 Ti (mělo by jít o verze Founders Edition, 2080 Ti je tedy přetaktovaná).
Proti původní RTX 2080 (zase Founders Edition) uvádí Tom's Hardware nárůst o 71,2 %, TechPowerUp uvádí výkon vyšší o 67 %. Proti Radeonu RX 5700 XT vychází přesně dvakrát rychlejší (+100 %) u ComputerBase a techPowerUpu, v metodice Tom's Hardware vychází RTX 3080 „jen“ o 90,3 % rychlejší.
2560 × 1440
V rozlišení 1440p vychází GeForce RTX 3080 o 52 %/43 %/45 % rychlejší proti GeForce RTX 2080 Super a o 28 %/24 %/23,9 % rychlejší proti GeForce RTX 2080 Ti. Radeon RX 5700 XT poráží tato nová karta Ampere o 88 %/75 %/75,6 %. Původní model RTX 2080 Founders Edition předstihuje podle TPU o 52 % a podle THW o 55,5 %.
1920 × 1080
V rozlišení Full HD, zajímavém například pro soutěžní hráče nebo majitele vysokorychlostních monitorů, má GeForce RTX 3080 relativně nejmenší přínos. Proti GeForce RTX 2080 Super je rychlejší o 40 %/30 %/33,8 %, proti GeForce RTX 2080 Ti o 21 %/15 %/18,3 % a proti Radeonu RX 5700 XT jí vychází o 69 %/54 %/57,2 % lepší výkon.
Proti původní GeForce RTX 2080 Founders Edition uvádí techPowerUp nárůst o 35 % a Tom's Hardware o 42,5 %.
Souhrnné grafy z těchto recenzí si můžete prohlédnout v galerii. Přiložili jsme i tabulku webu 3DCenter.org. Která uvádí relativní výkon různých grafik k GeForce RTX 3080 v recenzích různých redakcí a průměr mezi nimi; tyto výsledky jsou jen čistě pro rozlišené 4K, kde to Amperu nejlépe proudí.
Galerie: Výkon Nvidia GeForce RTX 3080 ve světových recenzích
Kde je 2× výkon proti RTX 2080?
V reakcích se občas objevila poměrně oprávněné kritika, že karta nemá – alespoň pokud průměrujeme pro odbourání extrémních výchylek – ve hrách 2× výkon proti GeForce RTX 2080, jak Nvidia (slovy svého CEO) při vydání slibovala. Zde je klíčové, že u toho palebně krylo ústupovou cestu ono slovo „až“. Ovšem v tomto případě to jeho význam možná napíná, protože takovéto zrychlení podle všeho není moc typický případ. Linus z Linus Tech Tips dostal k této diskrepanci vyjádření, že 2× zrychlení by karta měla dosahovat v plně raytracingových (path-traced) hrách jako je Quake RTX. Ovšem prakticky všechny hry jsou dnes a ještě asi pár let budou hybridní.
Nicméně dobrá zpráva je, že až tak nesplněný tento slib není, protože toto 100 % (a někde i o trošku vyšší) zrychlení proti RTX 2080 zdá se karta dokáže dosáhnout v neherních výpočtech. V 3D renderingu používajícím GPU (Blender, V-Ray), byly časy vykreslování proti RTX 2080 méně než pololoviční. Toto ale asi samozřejmě také nemusí platit pro všechny aplikace (SPECviewperf mělo o dost nižší nárůst výkonu).
Článek pokračuje na další straně.
PCI Express 4.0, vliv CPU...
Je třeba PCI Express 4.0?
TechPowerUp jinak přichystal také test škálování výkonu s různými generacemi PCI Expressu – jinými slovy toho, jak moc karta potřebuje desku (a CPU) s podporou PCI Expressu 4.0. Asi vás nepřekvapí, že PCI Express 4.0 podle tohoto testu zdaleka není kritický. Zkoušeno je to s Ryzenem R9 3900XT a deskou platformy X570. V průměru vyšel techPowerUpu rozdíl 1%, PCIe 3.0 ×16 tedy dosahuje 99 % výkonu PCI Expressu 4.0 ×16, což je poměrně zanedbatelné. Instalace do PC, která mají sloty jen PCIe 3.0 ×16 (tj. například se současnými platformami Intel) tedy v praxi není žádný problém.
Toto je napříč všemi rozlišeními (1080p, 1440p i 4K) a v průměru jsou zahrnuté i některé hry, které nemají na nižších rozlišeních rozdíl žádný, protože výkon byl limitován hrubým výkonem CPU. V některých hrách tedy rozdíl může být drobně vyšší, ale pořád v malých jednotkách procent.
O trošku větší dopad by byl, pokud byste GPU provozovali na PCIe 3.0 ×8 kvůli rozdělení linek například mezi GPU a SSD. Tam už je rozdíl nějaká tři procenta (v grafech se dívejte na srovnání PCIe 2.0 ×16 a PCIe 3.0 ×16, což odpovídá propustnostem PCIe 3.0 ×8 a PCIe 4.0 ×8).
PCI Express 4.0 samozřejmě nabude na důležitosti, když/pokud hry začnou agresivně používat funkci DirectStorage (RTX IO). Pokud by programátoři načítali z NVMe SSD tolik dat, že by PCIe 3.0 ×4 u SSD už nestíhalo, pak samozřejmě vyvstane limit. Ovšem zatím tuto techniku žádné hry nevyužívají a větší rozšíření se dá čekat až pár let po dostupnosti GPU. Vývojáři logicky nemohou na tuto funkci moc spoléhat, protože na PC, kde nebude dostupné (a třeba ještě jen s SATA SSD), by načítání textur bylo výrazně pomalejší, než jaký je teoretický limit DirectStorage přes PCIe 4.0 ×4.
Procesor Intel versus AMD
Podobně techPowerUp udělal i test toho, jaký je rozdíl, když tuto kartu provozujete na Intel Core i9-109000K, nebo procesoru AMD (Ryzen 9 3900XT). Tento test najdete zde. Jak už to bývá, největší rozdíl je v rozlišení FullHD, kde je karta poměrně výrazně limitována výkonem procesorů. Ve 1920 × 1080 bodech je výkon Ryzenu 9 3900XT v průměru asi 90 % Core i9-10900K.
Ve vyšších rozlišeních je rozdíl menší – 93 % na 2560 × 1440 bodech a 99 % ve 4K. Ve 4K je limit prakticky zcela na straně GPU samotného. Test byl jinak udělán s pamětí DDR4-3733, na obou systémech byla nastavená na stejné časování.
Článek pokračuje na další straně.
Founders Edition nebo nereferenční karty?
Web techPowerUp po Founders Edition vydal ještě čtyři recenze nereferenčních modelů (Palit, Zotac, MSI, Asus), takže si můžete porovnat, jaké jsou mezi nimi a FE od Nvidie rozdíly.
Chladiče Founders Edition se Nvidii zdá se povedly a chladí velmi dobře (zvlášť když si vezmete už skoro bezprecedentní TDP). Mají konečně polopasivní režim, takže se v nečinnosti ventilátory úplně odpojí, toto u Turingů chybělo. A také design je asi z karet nejhezčí. Ale neznamená to, že jsou tyto karty nejlepší a nereferenční custom karty výrobců „zabily“, jak si někdo možná mohl unáhleně myslet první den, když byly venku ještě jen jejich testy.
Vypadá to, že minimálně některé nereferenční modely (mají obvykle tři ventilátory) zvládají chlazení lépe. Například techPowerUpem testovaná karta Gaming X Trio od MSI, která je přetaktovaná (při hraní má takty až o 4,5 % vyšší), má údajně v zátěži stejnou spotřebu, těsně nižší teploty, a přitom je výrazně tišší. Karta TUF Gaming OC od Asusu má v režimu výkonu stejnou nebo drobně lepší hlučnost, ale o 15 stupňů lepší teploty. Ale v tichém režimu dává výrazně tišší výsledek, jen 31 dB.
Naproti tomu třetí karta, kterou techPoweUp testoval, Palitova verze Gaming Pro OC, má stejnou hlučnost jako Founders Edition, jenže také nižší teploty. Zotac Trinity byla také chladnější a zároveň výrazně tišší. Tyto karty mají přitom stát doporučenou cenu, nejsou to tedy příplatkové nereference.
Speciální design karty Founders Edition tudíž není zas tak „kouzelný“ a nějak výlučný. Minimálně by by u něj asi pomohl třetí ventilátor, pak by možná design s „oknem“ ukázal své přednosti. Custom karty partnerů, aspoň ty lepší, evidentně mají chlazení efektivnější (i když je možné, že jejich výhoda se zmenší nebo zmizí v hůře ventilovaných skříních). Founders Edition asi zase bude volba, pokud vám jde o vzhled. A nevyžadujete RGB osvětlení integrované přímo v kartě.
Článek pokračuje na další straně.
To horší: energetická efektivita moc nestoupla, výkon táhne spotřeba
Spotřeba
Výhřevnost/příkon jsou nakonec přesně takové, jak hrozila vysoká hodnota TDP, žádný nečekaný zázrak nepřišel. V testu ComputerBase vychází v zátěži na 322 W, u Tom's Hardware vychází 333 W. techPowerUp uvádí průměr 303 W a maximum 348 W (FurMark údajně 370 W, ale to je jako vždy výjimka). Přetaktovaná karta samozřejmě bude žrát víc, u FoundersEdition karty je ovšem limit, kam vás Nvidia nechá spotřebu zvýšit, 370 W. Vypadá to však, že budou nereferenční kary se zvýšenými TDP, některé RTX 3080 mají 340 W.
Spotřeby na desktopu a při přehrávání videa z Youtube zdá se nijak vybočují z průměru (video je trošku podprůměrné, například 66 W ve 2016p60/HDR, 33 W bez HDR podle ComputerBase, ale v rámci normálu).
Přetaktování: rezerva malá, GDDR6X záchrana
Prostor pro přetaktování GeForce RTX 3080 má, ale zdá se, že hlavně u pamětí, které se dají popohnat o slušná procenta (například techPowerUp uvádí +11 %). GPU ovšem je asi vyhnáno hodně vysoko na své křivce efektivity už v základu, zvýšení power limitu z 320 W na maximálních 370 W podle TPU získalo jen asi 1 % reálného výkonu. Podobně při manuálním taktování se podařilo nastavit boost 1855 MHz, ale průměrný takt stoupl z 1931 MHz, na nichž karta normálně jede ve hrách, na 1947 MHz, také jen o 1 %. Spolu s přetaktovanou pamětí se ale v Unigine Heaven podařilo dostat celkově o 3,9 % lepší skóre, GDDR6X ty OC Ampere dost zachraňuje.
ComputerBase dosáhl zvýšení výkonu v průměru o 4–5 % se spotřebou 371 W. Přetočit GPU se mu povedlo o 74 MHz (Power limit zvýšený na maximálních 370 W), pak GPU přestalo být stabilní. Provozní frekvenci ve hrách dostal na 2025 MHz, ale při vyšších teplotách už byla jen 1965 MHz. Paměti GDDR6X se ale opět povedlo popohnat o 13 %. Teplota karty Founders Edition při 370 W přetaktování byla 80°C, ale hlučnost už hodně stoupla, otáčky ventilátorů prý šly na 2500 RPM.
Andreas Schilling z HardwareLuxx uvádí, že „výnosnější“ než přetaktování je podvoltování. Snížení TDP na 280 W (o 40 W, 12,5 %) například stojí jen 3 % výkonu.
Výkon na jeden watt stoupl málo
Z toho to vypadá, že GPU je provozováno na relativně vyšších, méně optimálních taktech, než Turing nebo Pascaly, což nechává menší prostor k OC. Vysvětlovalo by to, proč relativně málo narostla energetická efektivita, tedy výkon na 1 W spotřeby. Architektura Ampere by ji asi potenciálně i měla, ale Nvidia ji obětovala zvednutím taktů a napětí na oltář vyššího výkonu.
Energetická efektivita totiž u dané architektury CPU nebo GPU není konstantní. Každý čip má křivku frekvencí a napětí, na nichž může fungovat, která je nelineární/exponenciální (a samozřejmě končí maximálním napětím, které se křemík přežije). Pokud vám stačí frekvence někde na méně strmé části křivky, dostanete pěknou efektivitu. Pokud ale chcete nebo kvůli něčemu musíte (konkurence či jiné tlaky na výkon) posunout takty směrem do části, kde začíná strmější exponenciální růst, tak se nejednou efektivita začíná zhoršovat. Pokud srovnáváte dvě architektury na různých pozicích těchto křivek, je tím samozřejmě zkreslena jejich skutečná úroveň efektivity.
Případ, kdy výrobce čip posunul po křivce výš, byly grafiky AMD v minulých generacích Radeonů, které ostatně tento nízký potenciál pro OC, nahnání taktů vysoko a atraktivní podvoltování připomíná. U Ampere podle vysokého TDP zdá se i Nvidia možná posunula frekvencemi do více neefektivního pásma, minimálně ve srovnání s Turingem a Pascalem. A proto možná RTX 3080 a RTX 3090 mají relativně vysoká TDP, ačkoliv proti Turingu se plocha čipu dost zmenšila.
ComputerBase výkon a příkon propočítal a vychází mu, že proti GeForce RTX 2080 Ti je energetická efektivita RTX 3080 lepší jen o 10 % (srovnejte hodně zavádějící tvrzení o 1,9× zlepšení, s kterým přišla Nvidia při odhalení). Proti GeForce RTX 2080 Super už to vypadá trošku lépe, zlepšení vychází o 20 % (1,2×). Je to proto, že u refreshe Turingu také Nvida trošku zhoršila efektivitu zvýšením frekvencí a TDP proti první generaci karet. Toto číslo se bude různě hýbat sem tam podle toho, jaké přesně karty porovnáte, ale zatím to tedy vypadá na nárůsty spíš malé. Ideálně by asi chtělo zjistit, zda třeba efektivitu GPU netáhne dolů vysoká spotřeba pamětí GDDR6X, ale výsledky celých karet holt vypadají takto.
Výkon Ampere a vysoká spotřeba: dvě strany téže mince
Toto je nakonec také tajemství toho, proč je mezigenerační nárůst výkonu mezi Turingem a Ampere tak vysoký a jeho odvrácená mince. Z velké části ho umožnilo navýšení spotřeby (mezi GeForce RTX 2080 a RTX 3080 skoro o 50 %, z 215 na 320 W). Pokud by byla TDP podobná, pochopitelně by byly karty k sobě výkonem blíže. Jako uživatelům vám toto ovšem nemusí vadit (pokud se přenesete přes účet za elektřinu). Nebo aspoň nyní.
Už větší problém by ale samozřejmě nastal, kdyby si výrobci GPU tímto chtěli pomáhat opakovaně, protože pak by se nárůsty spotřeby kumulovaly... určitě by tedy bylo lepší, pokud by další generace už vyšší hodnoty neatakovaly, nebo aby aspoň nárůsty byly pozvolné a na 450 W jsme se dostali třeba až za 10 let a ne za dvě. Ideální by samozřejmě bylo, kdyby nastala korekce zpět k předchozím mezím (250–300 W).
Nová generace má skvělý poměr cena/výkon, ale jak dopadne ve srovnání s konkurencí, je zatím nejasné
S touto výhradou ovšem pořád tyto karty vypadají jako velmi výkonné a výhodné grafiky, posun výkonu je velmi výrazný (byť marketing sliboval víc). Protože karta stojí stejně jako RTX 2080 Super při vydání, jde toto zlepšení výkonu prakticky celé i do poměru cena/výkon, což je proti Turingu kritizovanému přesně za toto skvělé. Jen holt zlepšení poměru cena/výkon není dáno architektonicky, ale tím navýšením spotřeby.
Uvidíme, zda toto nezpůsobí, že bude konkurenční AMD mít více prostoru k ohrožení karet Nvidie. GeForce totiž v posledních dvou–třech generacích držely Radeony v šachu kombinací toho, že AMD nevyrábělo větší highendová GPU (případ Polarisu, RDNA 1) a vyšší energetické efektivity (zejména případ Vegy). Jednu z těchto zbraní teď zdá se Nvidia nepoužila, což může AMD pomoci. Ale to teprve uvidíme, je možné, že samo AMD bude mít vlastní problémy.
Poměr cena/výkon bude také lepší hodnotit až spolu s dalšími grafikami této nové generace, mimo Radeonů RX 6000 také GeForce RTX 3070 a dalšími modely Ampere. Nová generace bude asi celkově o hodně lepší než dosavadní karty, takže nakonec v ní RTX 3080 nemusí moc vyčnívat. To se snad ukáže během následujících 2-3 měsíců.